S-flannel dns 질의 실패
문제 상황
이전에 로컬 클러스터를 구축하고나서 사실 계속 어려운 점에 봉착하고 있었다.
dns가 정상 작동하지 않는다는 것.
문제 대응
- core dns 파드가 작동하고 있는지
- 작동했다.
- 로그는 뜨는지
- 안 뜨고 있었다.
- 앞단에 kube-dns 서비스가 떠있고 eip가 만들어졌는지
- 전부 잘 돼 있었다.
- 인터넷으로 나가는 트래픽은 정상적인지
- 매우 정상
로그는 뜨지 않지만 모든 리소스가 정상적으로 돌아가고 있다.
정확하게 dns 질의 주소도 명시돼 있었다.
상황 자체는 패킷이 날아가고 돌아오지 못하는 것.
그래서 계속 timed out이 뜨는 것이라고 판단했다.
설정된 주소가 잘못 된 것이 아니라는 것은 여태 보면서 확인했다.
내 생각에는 모든 요청은 제대로 가지만, coredns 파드가 제대로 요청을 처리해내지 못하는 것.
사실 여기까지 판단은 섰지만, 그 이후로 추가적인 트러블슈팅은 하지 못했다.
coredns가 virtualbox로 구축한 클러스터에서 문제가 발생하는 것일까?
그러다가 cni가 flannel인 것에 살짝 마음이 걸려서 calico로 바꿔 다시 시도해보았다.
깨달은 점
깨닫은 건 그냥 다른 사람들 쓰는 거 쓰자는 것..?
명확한 이유에 대한 규명 없이 해결된 케이스.
그보다는 내가 뭐가 부족한지 깨달은 듯.
네트워크 관련 디버깅을 하는 방법을 일단 잘 모르겠다는 것.
그리고 네트워크 흐름을 잘 파악하지 못한다는 것.
나중에 조금 더 깊게 알게 되면 이 이슈는 다시 정리하게 될 것 같다.
어차피 flannel은 앞으로도 안 쓸 것 같기는 한데 그래도 flannel 상에서 어떻게 문제를 해결할 수 있을지 궁금하긴 하다.